# beta_bank_project
Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых.
Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Вам предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.
Постройте модель с предельно большим значением F1-меры. Чтобы сдать проект успешно, нужно довести метрику до 0.59. Проверьте F1-меру на тестовой выборке самостоятельно.
Дополнительно измеряйте AUC-ROC, сравнивайте её значение с F1-мерой.
Источник данных: https://www.kaggle.com/barelydedicated/bank-customer-churn-modeling

Для решения задачи необходимо построить модель с максимально большим значением F1-меры. 
Заказчик требует довести метрику до 60%. Первым шагом будет получение и изучение данных для обучения моделей. 
Для обучения модели необходимо кодировать категориальные значения, а также исключить пропуски в данных. 
Далее разделим кодированный датафрейм на обучающую, валидационную и тестовые выборки. 
Проверим данные на дисбаланс, исследуем его влияние на поведение модели, уменьшим влияние данного дисбаланса. 
Так как перед нами стоит задача классификации, то обучим несколько моделей (Логистическая регрессия, Дерево решений и Случайный лес) и выделим лучшую с помощью метрики F1. 
Проверим F1-меру на тестовой выборке самостоятельно (предварительно дообучив модель на валидационной выборке, т.к. чем больше данных - тем лучше), затем измерим AUC-ROC, сравним её значение с F1-мерой.
